检索结果

Select

1. 基于不同敏感度的改进 K-匿名隐私保护算法

翟冉, 陈学斌, 张国鹏, 裴浪涛, 马征

《计算机应用》唯一官方网站 2023, 43 (5): 1497-1503. DOI: 10.11772/j.issn.1001-9081.2022040552

摘要（353）

HTML （9）

PDF （1192KB）（217）

针对机器学习的发展需要大量兼顾数据安全性和可用性的真实数据集的问题，提出一种基于随机森林（RF）的K-匿名隐私保护算法——RFK-匿名隐私保护。首先，使用RF算法预测出每种属性值的敏感程度；然后，使用k-means聚类算法将属性值根据不同敏感程度进行聚类，再使用K-匿名算法根据属性值的敏感程度集群对数据进行不同程度的隐匿；最后，由用户自主地选择需要哪种隐匿程度的数据表。实验结果表明，在Adult数据集中，与K-匿名算法处理过的数据相比，RFK-匿名隐私保护算法处理过的数据在阈值分别为3、4时的准确率分别提高了0.5、1.6个百分点；与（p，α，k）-匿名算法处理过的数据相比，RFK-匿名隐私保护算法处理过的数据在阈值分别为4、5时的准确率分别提高了0.4、1.9个百分点。RFK-匿名隐私保护算法在保护数据的隐私安全的基础上能有效提高数据的可用性，更适合应用于机器学习中的分类预测。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 融合特征选择的随机森林DDoS攻击检测

徐精诚, 陈学斌, 董燕灵, 杨佳

《计算机应用》唯一官方网站 2023, 43 (11): 3497-3503. DOI: 10.11772/j.issn.1001-9081.2022111792

摘要（155）

HTML （3）

PDF （1450KB）（104）

现有基于机器学习的分布式拒绝服务（DDoS）攻击检测方法在面对愈发复杂的网络流量、不断升维的数据结构时，检测难度和成本不断上升。针对这些问题，提出一种融合特征选择的随机森林DDoS攻击检测方法。该方法选用基于基尼系数的平均不纯度算法作为特征选择算法，对DDoS异常流量样本进行降维，以降低训练成本、提高训练精度；同时将特征选择算法嵌入随机森林的单个基学习器，将特征子集搜索范围由全部特征缩小到单个基学习器对应特征，在提高两种算法耦合性的同时提高了模型精度。实验结果表明，融合特征选择的随机森林DDoS攻击检测方法训练所得到的模型，在限制决策树棵数和训练样本数量的前提下，召回率相较于改进前提升21.8个百分点，F1-score值提升12.0个百分点，均优于传统的随机森林检测方案。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 改进的联邦加权平均算法

罗长银, 王君宇, 陈学斌, 马春地, 张淑芬

《计算机应用》唯一官方网站 2022, 42 (4): 1131-1136. DOI: 10.11772/j.issn.1001-9081.2021071264

摘要（604）

HTML （16）

PDF （468KB）（288）

针对基于层次分析改进的联邦平均算法在计算其数据质量时存在主观因素的影响，提出改进的联邦加权平均算法，从数据质量的角度来处理多源数据。首先，将训练样本划分为预训练样本与预测试样本；然后，使用初始全局模型在预训练数据上的精度作为该数据源的质量权重；最后，将质量权重引入到联邦平均算法中，重新进行全局模型中权重更新。仿真结果表明，在均等分割的数据集与非均等分割的数据集上，改进的联邦加权平均算法训练的模型与传统联邦平均算法训练的模型相比，准确率最高分别提升了1.59%和1.24%；改进的联邦加权平均算法训练的模型与传统整合多方数据再训练的模型相比，虽然准确率略有下降，但数据与模型的安全性有所提升。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 面向本地差分隐私的K-Prototypes聚类方法

张国鹏, 陈学斌, 王豪石, 翟冉, 马征

《计算机应用》唯一官方网站 2022, 42 (12): 3813-3821. DOI: 10.11772/j.issn.1001-9081.2021101724

摘要（384）

HTML （5）

PDF （2056KB）（73）

为了在聚类分析中保护数据隐私的同时确保数据的可用性，提出一种基于本地化差分隐私（LDP）技术的隐私保护聚类方案——LDPK-Prototypes。首先，用户对混合型数据集进行编码；其次，采用随机响应机制对敏感数据进行扰动，而第三方在收集到用户的扰动数据后以最大限度恢复原始数据集；然后，执行K-Prototypes聚类算法，在聚类过程中，使用相异性度量方法确定初始聚类中心，并利用熵权法重新定义新的距离计算公式。理论分析和实验结果表明，所提方案与基于中心化差分隐私（CDP）技术的ODPC算法相比，在Adult和Heart数据集上的平均准确率分别提高了2.95%和12.41%，有效提高了聚类的可用性。同时，LDPK-Prototypes扩大了数据之间的差异性，有效避免了局部最优，提高了聚类算法的稳定性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 面向区块链的在线联邦增量学习算法

罗长银, 陈学斌, 马春地, 王君宇

计算机应用 2021, 41 (2): 363-371. DOI: 10.11772/j.issn.1001-9081.2020050609

摘要（696）

PDF （2197KB）（985）

针对传统数据处理技术存在模型过时、泛化能力减弱以及并未考虑多源数据安全性的问题，提出一种面向区块链的在线联邦增量学习算法。该算法将集成学习与增量学习应用到联邦学习的框架下，使用stacking集成算法来整合多方本地模型，且将模型训练阶段的模型参数上传至区块链并快速同步，使得在建立的全局模型准确率仅下降1%的情况下，模型在训练阶段与存储阶段的安全性均得到了提升，降低了数据存储与模型参数传输的成本，同时也降低了因模型梯度更新造成数据泄漏的风险。实验结果表明，在公开的数据集上进行训练，各时间段内模型的准确度均在91.5%以上，且方差均低于10 ^-5；与传统整合数据训练模型相比，该模型在准确率上略有下降，但能够在保证模型准确率的同时提高数据与模型的安全性。

参考文献 | 相关文章 | 多维度评价

Select

6. 联邦学习的公平性研究综述

张淑芬张宏扬任志强陈学斌

《计算机应用》唯一官方网站 DOI: 10.11772/j.issn.1001-9081.2023121881
预出版日期: 2024-04-02

Select

7. 面向部分图更新的动态社交网络隐私发布方法 #br#

高瑞陈学斌张祖篡

《计算机应用》唯一官方网站 DOI: 10.11772/j.issn.1001-9081.2023111706
录用日期: 2024-03-27

Select

8. 联邦学习中的安全威胁与防御措施综述

陈学斌任志强张宏扬

《计算机应用》唯一官方网站 DOI: 10.11772/j.issn.1001-9081.2023060832
预出版日期: 2023-08-03